iT邦幫忙

2024 iThome 鐵人賽

DAY 9
0
Python

Python自修系列 第 9

DAY9:如何使用Matplotlib進行數據可視化

  • 分享至 

  • xImage
  •  

安裝Matplotlib

pip install matplotlib
import pandas as pd
import matplotlib.pyplot as plt

# 從CSV文件讀取數據到Pandas DataFrame中
df = pd.read_csv('ptt_articles.csv')

# 將圖片URL列表和表格數據從字符串轉換回列表
df['images'] = df['images'].apply(lambda x: eval(x) if x else [])
df['tables'] = df['tables'].apply(lambda x: eval(x) if x else [])

# 計算每篇文章中的圖片數量和表格數量
df['image_count'] = df['images'].apply(len)
df['table_count'] = df['tables'].apply(len)

# 基本數據可視化
# 1. 繪製每篇文章的圖片數量分佈圖
plt.figure(figsize=(10, 6))
plt.hist(df['image_count'], bins=range(0, df['image_count'].max() + 2), color='skyblue', edgecolor='black')
plt.title('Distribution of Image Counts in Articles')
plt.xlabel('Number of Images')
plt.ylabel('Number of Articles')
plt.grid(True)
plt.show()

# 2. 繪製每篇文章的表格數量分佈圖
plt.figure(figsize=(10, 6))
plt.hist(df['table_count'], bins=range(0, df['table_count'].max() + 2), color='lightgreen', edgecolor='black')
plt.title('Distribution of Table Counts in Articles')
plt.xlabel('Number of Tables')
plt.ylabel('Number of Articles')
plt.grid(True)
plt.show()

# 3. 繪製圖片數量與表格數量的關係圖
plt.figure(figsize=(10, 6))
plt.scatter(df['image_count'], df['table_count'], color='coral')
plt.title('Relationship between Image Counts and Table Counts')
plt.xlabel('Number of Images')
plt.ylabel('Number of Tables')
plt.grid(True)
plt.show()

上一篇
DAY8:學習如何使用Pandas進行數據處理和分析
下一篇
DAY10:構建一個簡單的Web應用來展示數據
系列文
Python自修30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言